カテゴリ
  1. トップ
  2. 書籍
  3. 入門マルチモーダルRAG 図表を読み解くAIアプリケーションの実装
商品詳細画像

入門マルチモーダルRAG 図表を読み解くAIアプリケーションの実装

新納浩幸/著
著作者
新納浩幸/著
メーカー名/出版社名
オーム社
出版年月
2026年6月
ISBNコード
978-4-274-23493-4
(4-274-23493-2)
頁数・縦
163P 21cm
分類
工学/電気電子工学 /人工知能・AI
出荷の目安
5~10営業日前後で発送いたします。
お受け取りいただける日はお届けする国・量・時期により多少前後します。

価格¥2,600

出版社の商品紹介

出版社からのコメント

「図表を読めるAI」を作る近年、テキストだけでなく、図や表やグラフといった画像を含む資料からも情報を検索・活用できる「マルチモーダルRAG(Retrieval−Augmented Generation)」の重要性が高まっています。従来のテキストベースRAGが扱える情報はテキストデータに限定されており、実務現場で扱う文書−−技術報告書、研究論文、プレゼン資料−−のように、図表を多く含むデータには十分対応できませんでした。本書は、この課題を踏まえ、実務文書にも対応できるマルチモーダルRAGについて体系的に解説します。本書では、自分の手でマルチモーダルRAGを構築できるようになることを目指します。全体を通して、手を動かしながら理解できるよう、再現可能なコード例を多数提示しています。<本書の構成>・第1章基本的な構成のRAG(データベース・検索器・生成器)をPythonで実装し、RAGの仕組みを理解します。・第2章画像をテキストに変換する方式と、画像とテキストを同一のベクトル空間に埋め込む方式という、2種類のマルチモーダルRAG の実装方法を紹介します。・第3章Embed−4やCLIP−RAG、反復型RAGといった最新手法を概観し、マルチモーダル知覚統合の潮流を整理します。・第4章特定領域の画像(医療画像、技術図面など)に特化したマルチモーダル RAG の構築を目指し、projectorやLLM、デュアルエンコーダのファインチューニング方法を実例とともに解説します。

  • ※商品代の他に送料がかかります。
    送料は商品代・送付先によって変わります。詳しくは書籍の料金についてのご案内をご確認ください。
  • ※現時点でお取り扱いがない場合でも、今後購入可能となる場合がございます。
  • ※送付先を追加・変更される場合はご購入前にマイページよりご登録をお願いいたします。
  • ※商品は予告なく取り扱い中止となる場合がございます。
  • ※ご注文商品が在庫切れなどの際はキャンセルのご連絡をさせていただく場合がございます。
common-popup-caution

common-popup-caution